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(I) 



(57) Abstract 

A protein having at least 65 % sequence homology with the sequence (I). This protein may particularly be hard wheat or soft wheat 
thioredoxin h. The DNA corresponding to said protein may be integrated into an expression vector for production by microorganisms. 

(57) Abreg<5 

Proline pnfsentant une similitude de sequence d'au moins 65 % avec la sequence (I). Cette proline peut 6tre en particulier la 
thiorddoxine h de b!6 dur ou de b\6 tendre. L'ADN correspondant a cette proteine peut etre intfgrd dans un vecteur depression en vue de 
sa production par des micro-organismes. 
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Thioredoxines h de ble tendre et de ble 
dur et proteines presentant des similitudes, 
fragments d'ADN codant pour ces proteines 
et procedes d'obtention 

La presente invention a pour objet des 
thioredoxines h de ble tendre et de ble dur, des 
proteines presentant des similitudes ainsi que des 
fragments d'ADN codant pour ces proteines. 

Elle est en outre relative a des procedes 
d'obtention de ces proteines. 

Les thioredoxines sont des proteines de petites 
15 tallies impliquees dans divers processus biologiques 
et vraisemblablement presentes dans tous les 

organismes vivants . 

El les interviennent entre autres comme donneurs 
d'hydrogene pour des reductases (ribonucleotide, 

20 methionine sulfoxyde et sulfate reductase) et comme 
oxydoreductases des fonctions disulfure de plusieurs 
proteines. Pour les proprietes generales des 
thioredoxines on pourra avantageusement se referer a 
la revue de Pille (Annales de l'Institut Pasteur, 

25 volume 1, 34-50, 1992) ou de Holmgren (TIBS, Janvier 

1981, 26-29). 

Si les thioredoxines de bacteries sont bien 
connues, les thioredoxines h des organismes 
superieurs, et en particulier des plantes ont ete 
30 assez peu etudiees . 

Ainsi, seules les thioredoxines h de tabac 
(Marty et Meyer, Plant Molecular Biology, 17, 143-147, 
1991; Brugidou et al . , Mol Gen Genet , 238, 285-293, 
1993), de riz ( sequence EMBL N* D 26547), 
35 d'Arabidopsis thaliana ( Rivera-Madrid et al . , Plant 
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Physiol, 102, 327-328 , 1993 ) et de Chlamydomonas 
relnhardtii (Decottignies et al . Eur. J. Biochem, 198, 
505-512, 1991) ont ete a ce jour sequencees . 

Leur sequengage a ete effectue a partir d'ADN 
5 complementalre selectionne dans des banques d'ADN de 
tabac ou d* Arabidopsis thaliana par hybridation du 
clone portant l'ADN complementalre codant pour la 
thioredoxine h avec une sonde correspondant a un ADN 
complementalre de la thioredoxine hi de tabac pour 

10 Arabidopsis thaliana ( Rivera-Madrid et al . 

precedemment cite), c'est-a-dire une sonde 
heterologue, ou apres criblage par hybridation 
dif f erentielle (Marty et Meyer, precedemment cites). 

Zhong-Ru Gan (J. Biol. Chem, 1991, 266 (3), 

15 1692-1696) a sequence une thioredoxine de levure. Des 
amorces correspondant a des sequences encadrant le 
site actif de cette thioredoxine ont ete utilisees 
pour amplifier un fragment de 34 paires de base. Ce 
fragment a alors ete utilise comme sonde dans une 

20 hybridation du type Southern pour le criblage d'une 
banque genomique de levure. 

Muller et Buchanan (J. Biol. Chem. 1989, 264 
(7), 4008-4014) ont quant a eux decrits le clonage 
d'un gene codant pour une thioredoxine m, et non une 

25 thioredoxine h. La strategie utilisee pour le clonage 
consiste a faire une hybridation du type Southern du 
genome de la bacterie Anacystis nidulans, avec une 
sonde presentant des similitudes avec les sites actifs 
d'autres thioredoxines m puis a doner le fragment 

30 correspondant . 

A la connaissance du demandeur, les seules 
sequences de thioredoxine h de plantes qui etaient 
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publiees, et pouvaient done etre utilisees comme 
sondes, etaient celles de tabac et de Chlamydomonas 
reinhardtii; e'est-a-dire d'une plante dicotyledone et 
d'une algue unicellulaire . 
5 Ces sondes s'hybrident de maniere heterologue 

avec des ADN complementaires d'autres plantes 
presentant une grande distance evolutive , les mono- 
cotyledones . 

Ainsi, I'homme du metier desireux de 

10 selectionner des clones d 'ADN complementaires dans des 
banques de plantes mono-cotyledones etait incite a 
utiliser des sondes heterologues , done peu 
specifiques, et ce d'autant plus qu'excepte le site 
actif, il existe peu de similarite entre les sequences 

15 de thioredoxines h, et induisant ainsi des risques 
d'erreurs dans la selection des clones empechant toute 
selection specif ique . 

Or, les thioredoxines h interviennent de 
maniere importante chez le ble lors de la germination, 

20 et aussi en reduisant de maniere specifique les 
glutenines et d'autres proteines du grain de ble 
(Kobrehel et al , 1992, Plant Physiol,, 99, 919-924). 
Afin d'ameliorer la qualite de la farine de ble, par 
exemple 1 • etat d 1 oxydo-reduction de certaines 

25 proteines contenues dans cette farine, on peut 
modifier I'activite des thioredoxines h, au niveau 
genetique, en modifiant les genes des thioredoxines h 
ou en ajoutant de nouvelles copies de ces genes ou 
d ■ ADN complementaires correspondant a ces genes. 

30 II peut etre aussi envisage de rajouter des 

thioredoxines produites par des microorganismes dans 
des produits a usage alimentaire, ou de les utiliser 
pour supprimer l'effet antinutritionnel des 
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legumineuses ou pour inactiver des toxines, par 
exemple de venin d'abeilles ou de serpents. Dans tous 
ces cas, 11 peut etre necessaire, voire Indispensable, 
d'utiliser des ADN complementaires correspondant au 
5 gene de thioredoxine h pour produlre ces proteines • 

L'homme du metier se trouvait done confronte a 
une absence de methode fiable permettant la selection 
dans une banque d'ADN complementaire, de clones codant 
pour les thioredoxines h. 

10 Le demandeur s'est done attache a rechercher 

une sonde permettant de selectionner de man i ere 
specifique et fiable des clones de thioredoxine h dans 
une banque d'ADN complementaire, 

II a montre qu'il etait possible d'effectuer 

15 une telle selection en utllisant une sonde codant pour 
une sequence d'acides amines composant le site actif 
des thioredoxines . 

II a en outre montre que les thioredoxines h de 
bles dur et tendre presentent d'une part une grande 

20 similitude entre elles, mais d* autre part des grandes 
differences de structure primaire par rapport aux 
autres thioredoxines h de plantes dont les sequences 
sont deja connues . 

La presente invention a pour objet des 

25 proteines presentant une similitude de sequence d'au 
mo ins 65% avec la sequence SEQ ID N* 1 suivante: 
Gly Glu Val lie Ser Val His Ser Leu Glu Gin Trp Thr 
Met Gin lie Glu Glu Ala Asn Ala Ala Lys Lys Leu Val 
Val lie Asp Phe Thr Ala Ser Trp Cys Gly Pro Cys Arg 

30 lie Met Ala Pro lie Phe Ala Asp Leu Ala Lys Lys Phe 
Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp Glu Leu 
Lys Pro lie Ala Glu Gin Phe Ser Val Glu Ala Met Pro 
Thr Phe Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg 
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Val Val Gly Ala lie Lys Glu Glu Leu Thr Thr Lys Val 
Gly Leu His Ala Ala 

Preferentiellement, de telles proteines 
presentent une similitude avec la sequence SEQ ID N* 1 
5 d'au moins 75% et encore plus preferentiellement d f au 
moins 85 %• 

La presente invention a ainsi pour objet la 
thioredoxine h de ble tendre presentant la sequence 
SEQ ID N*3 suivante: 

10 
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d'une de ces proteines font aussi partie de la 
presente invention . 

La presente invention a en outre pour objet des 
fragments d'ADN codant pour une de ces proteines ou un 
5 de ces peptides et en particulier un fragment codant 
pour la thioredoxine h de ble tendre comprenant la 
sequence SEQ ID N*2 suivante: 

ATGGCGGCGT CGGCGGCGAC GGCGACGGCG ACGGCGGCGG CGGTAGGGGC 
GGGGGAGGTG ATCTCCGTCC ACAGCCTGGA GCAGTGGACC ATGCAGATCG 

10 AGGAGGCCAA CGCCGCCAAG AAGCTGGTGG TGATTGACTT CACTGCATCA 

TGGTGCGGAC CATGCCGCAT TATGGCTCCA ATTTTCGCTG ATCTCGCCAA 
G AAGTTC CCA GCTGCTGTTT TCCTCAAGGT CGACGTTGAT GAACTGAAGC 
CCATTGCTGA GCAATTCAGC GTGGAGGCCA TGCCAACCTT CCTGTTCATG 
AAGGAAGGAG ATGTCAAGGA CAGGGTTGTC GGAGCTATCA AGGAGGAACT 

15 GACGACCAAG GTTGGGCTAC ACGCGGCCCA GTAA 

et un fragment codant pour la thioredoxine de ble dur 
comprenant la sequence SEQ ID N*4 suivante : 
ATGGCGGCGG CGGCGACGGC G AC G AC T AC A GCGGCGGCGA CGGCGGCGGC 
GGTGGGGCCG GGGGAGGTGA TCTCCGTCCA CAGCCTGGAG CAGTGGACCA 

20 TGCAGATCGA GGAGGCCAAC GCCGCCAAGA AGCTGGTGGT GATTGACTTC 
ACTGCATCAT GGTGCGGACC ATGCCGCATC ATGGCTCCAA TTTTTGC TG A 
TCTCGCCAAG AAGTTCCCAG CTGCTGTTTT CCTCAAGGTC GACGTTGATG 
AACTGAAGCC CATTGCTGAG CAATTCAGCG TCGAGGCCAT GCCAACCTTC 
CTGTTCATGA AGGAAGGAGA CGTCAAGGAC AGGGTTGTCG GAGCTATCAA 

25 GGAGGAGCTG ACGACCAAGG TTGGGCTCCA CGCGGCTGCC TAG 

Elle a aussi pour objet une methode de 
selection dans une banque d'ADN complementaire de 
clones codant pour une thioredoxine h caracterisee en 
ce qu'on hybride lesdits clones avec une sonde 

30 presentant une similitude de sequences proche de 100% 
avec le site actif des thioredoxines . 

Avantageusement, une telle sonde presente la 
sequence suivante : (SEQ ID N* 6) 
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TGGTGX 1 GGX 2 CCX 3 TGX 4 AAX 5 ATG 

dans laquelle : 

Xj represente C ou T 
X 2 represente T ou A 
5 X 3 represente A, G, C ou T 

X 4 represente C ou T 
X 5 represente G ou A 

On remarquera, conune le montrent les 
comparaisons effectuees dans les exemples qui suivent 
10 , que les thioredoxines h de ble presentent une grande 
difference de structure primaire par rapport aux 
thioredoxines h de plantes deja connues . 

II n'etait done en rien evident pour 1 ■ homme du 
metier de deduire les sequences de ces thioredoxines h 
15 de ble des sequences d'autres thioredoxines h 
divulguees dans 1 ' etat de la technique. 

En outre, l'obtention d'ADN complementaires 
( ADNc ) pour un gene donne n'est pas, malgre les 
developpements recents dans les techniques de biologie 
20 moleculaire, une technique de routine. 

En effet, l'obtention d'un ADNc particulier 
necessite la mise au point d'un procede specifique qui 
va bien au-dela d'une simple adaptation d'une 
technique. En particulier le choix du materiel dont 
25 sont extraits les ARN messagers est essentiel. Cette 
specif icite est d'autant renforcee que les ARN 
messagers sont en faibles quantites ce qui est le cas 
de la presente invention. 

On notera de plus que 1 • utilisation 
30 d'oligonucleotides degeneres pour cribler les ADN 
complementaires n'avait jamais ete mise en oeuvre dans 
le cas des thioredoxines h . H n'etait en rien 
evident qu'une telle utilisation permette un criblage 
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ef f Icace . 

Le ble est une graminee d ■ un poids economique 
considerable et son amelioration, ainsi que celle de 
ses produits en utilisant les thioredoxines h ou des 
5 fragments d'ADN codant pour ces proteines, constituent 
des progres techniques importants . 

La presente invention est de plus relative a 
des vecteurs d' expression portant un fragment d'ADN 
tel que defini ci-dessus, et en particulier portant au 
10 moins une partie de la sequence SEQ ID N # 2 ou de la 
sequence SEQ ID N*4 decrites ci-dessus. 

De tels vecteurs comprennent au moins : 

- une origine de replication adaptee a l'espece 
biologique, microorganisme ou autre, dans laquelle on 

15 souhaite reproduire le vecteur; 

- un promoteur situe en amont du fragment d'ADN 
, adapte a l'espece biologique dans laquelle on 
souhaite exprimer les proteines selon 1' invention. 

lis peuvent aussi comprendre des sequences de 
20 regulation de 1' expression du promoteur. Ce promoteur 
peut etre soumis a regulation selon les conditions de 
culture des microorganismes . 

De tels vecteurs peuvent etre particulierement 
des vecteurs de secretion/ ou d' excretion. 
25 De maniere avantageuse, les fragments d'ADN 

definis ci-dessus sont integres dans un plasmide, et 
en particulier dans le plasmide pET commercialise par 
Novagen (USA) . 

Des vecteurs pETtrxTa et pFL61trxTa portant la 
50 sequence identif iee ci-dessus SEQ ID N # 2 ont ete 
deposes respectivement sous les numeros 1-1442 et I- 
1443 aupres de la Collection Nationale de Cultures de 
Microorganismes de l'Institut Pasteur ( CNCM) . 
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25 



D'autres objets de la presente invention sont 
des microorganismes, des cellules eucaryotes, et en 
particulier des cellules vegetales ou animales, et des 
plantes transgeniques portant une des sequences 
definies ci-dessus. Un tel microorganisme est 
avantageusement une bacterie, telle que E. coli ou une 
corynebacterie, une levure ou un champignon 
filaraenteux. Des cellules animales peuvent etre, par 
exemple, des cellules d'insectes. 

Les especes biologiques portant ces fragments 
et/ou vecteurs sont choisies afin de permettre une 
expression des proteines selon 1' invention. 

Enfin, la presente invention est relative a un 
procede de production des proteines selon 1' invention, 
15 et en particulier de thioredoxines h, comprenant les 

etapes suivantes : 

- culture d'un microorganisme tel que defini 

ci-dessus, et 

- isolement des proteines ou peptides selon 
20 1* invention produits par ledit microorganisme. 

Le present procede n'est pas limite a 
l'obtention de derives de thioredoxines h de ble . II 
peut aussi etre applique a la production de 
thioredoxines h d'autres cereales telles que le mails, 
l'orge, le seigle, le sorgho ou le riz, de 
legumineuses telles que le soja, 1' haricot ou le pois 
ou d'oleagineux tels que le tournesol, le chanvre, le 
lin ou le colza, ou de derives de ces thioredoxines h, 
a l'aide de vecteurs portant des sequences codant pour 

30 ces proteines. 

Avantageusement, les microorganismes sont lyses 
apres culture et les proteines selon 1 ' invention sont 
recuperees par des methodes connues de 1 • homme du 
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metier. 

L ' homme du metier pourra se referer, si 
necessaire, pour la preparation des proteines selon 
1 1 invention, de leurs vecteurs ou de microorganismes 
5 portant ces vecteurs, et de maniere generale pour la 
mise en oeuvre de la presente invention au manuel 
suivant : Maniatis et al . Molecular cloning : A 
Laboratory Manual , Cold Spring Harbor Laboratory 1982 
ou a une de ses recentes renditions . 

10 Les proteines objets de la presente invention 

ou pouvant etre obtenues selon un precede objet de la 
presente invention peuvent etre utilisees dans de 
nombreuses applications , en particulier, comme 
additifs dans des produits a usage alimentaire ou non 

15 alimentaire, pour la suppression de l'effet 
antinutritionnel des legumineuses , pour 1 1 inactivation 
de diverses toxines en particulier celles de venin 
d 1 abeilles et de serpents . 

Ces applications et d'autres applications sont 

20 repertoriees dans la demande PCT/US 92/08 595 dont le 
contenu est integre a la presente demande par 
reference . 

La production de thioredoxine h de ble dans la 
levure, en particulier Saccharomyces cerevisiae, 

25 permet de l'utiliser directement dans les produits 
alimentaires sous forme de levures enrichies en 
thioredoxine h (par induction de l'expression du gene 
ou par accumulation de la thioredoxine h dans la 
levure), sous forme lyophilisee par exemple. 

30 Le fait d'obtenir des thioredoxines h de ble 

par le procede selon 1' invention permet de les ajouter 
a un produit consomme par les humains tout en leur 
conservant leur caractere naturel. 
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La presente invention permet en outre d'obtenir 
de la thioredoxine h de ble en quantite importante 
(par rapport a une purification a partir de ble) par 
exemple a partir de cultures de bacteries ou de 
5 levures et d'ajouter cette thioredoxine h, apres 
purification ou en utilisant des levures enrichies 
(surexprimant la thioredoxine h) , a des produits 
cereal iers en vue d'ameliorer leur valeur 
d'utilisation . 

10 Le f a it de disposer des sequences codant pour 

les thioredoxines h de bles dur ou tendre permet de 
les modifier par mutagenese dirigee et d'obtenir des 
thioredoxines h dont les proprietes sont modifiees, et 
en particulier dont l'activite est amelioree par 

15 rapport a celle de la thioredoxine h isolee du ble. 

La presente invention est illustree sans pour 
autant etre limitee par les exemples qui suivent dans 
lesquels : 

La figure 1 illustre les differences de 
20 sequences des thioredoxines h de ble tendre 
(THIOBLETA) de ble dur (THIOBLETD) , de riz (THIORIZ), 
d'Arabidobsis (THIOARA) , de thioredoxine h2 de tabac 
(THIOTABAC2) , de thioredoxine hi de tabac (THIOTABAC) 
et de Chlamydomonas reinhardtii (THIOCHLA) . 
25 La figure 2 illustre la construction du 

plasmide pETtrxTa. 

Les figures 3 et 4 representent respectivement 
un gel de polyacrylamide-SDS apres coloration au bleu 
de Coomassie et un Western-blot effectue avec un 
30 anticorps dirige contre la thioredoxine h de ble de : 

1. lysat de bacteries avant induction, 

2. culot des proteines insolubles du lysat 
apres 3h d* induction, 
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3. culot apres chauffage des proteines solubles 
du lysat, 

4. surnageant apres chauffage des proteines 
solubles du lysat, 

5 5. comme 2 apres 6h d 1 induction, 

6 . comme 3 apres 6h d ' induction, 

7. comme 4 apres 6h d' induction. 

Les figures 5 et 6 representent schematiquement 
les plasmides pFL61 et pVT-U 100. 
10 EXEMPLE 1; Obtention de clones de thioredoxine h de 
ble tendre 

1 * ) Construction de la banque d'APN 
complementalre f ADNc) . 

L 1 extraction des ARN totaux de graines et la 
15 selection des ARN poly (A) + ont ete effectuees comme 
decrit par Gautier et al. ( Plant Mol Biol., 14, 313- 
322, 1990). 

5jig d'ARN poly (A) + issus de graines de 
Triticum aestivum L. , variete capitole en cours de 

20 maturation (23 jours apres floraison ) ont ete 
utilises pour construire une banque d 'ADN 
complementaire, en utilisant le Systeme Superscript 
Plasmid commercialise par BRL. 

Les ADN complementaires presentant une taille 

25 superieure a 500 pb sont ligues au plasmide pSPORTl 
commercialise par BRL coupe par les enzymes Notl-Sall, 
qui est utilise pour transformer des cellules 
d • Escherichia coli DH5a. 

2.10^ bacteries recombinantes sont obtenues 

30 avant ampl if i cat ion de la banque . Environ 3000 
recombinants sont etales et les colonies sont 
transferees sur une membrane Hybond C (Amersham) selon 
les instructions du fabricant. 
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2* ) isolement d'un clone coda nt pour une 

thioredoxine h de ble t endre. 

La banque d'ADN complementaire obtenue en 1') 
est criblee a l'aide d'un melange d ' oligonucleotides 
5 de synthese presentant la sequence ID N* 6 suivante : 
TGGTGX ! GGX 2 CCX 3 TGX 4 AAXg ATG 
dans laquelle : 

Xj represente C ou T 

X 2 represente T ou A 
10 X 3 represente A, G, C ou T 

X 4 represente C ou T 

X 5 represente G ou A 

Un melange contenant ces oligonucleotides 
synthetiques marques a leurs extremites 5' par du 
15 gamma- 32 P ATP a l'aide de la polynucleotide kinase T4 
a ete utilise. 

Les f litres ont ete prehybrides (16 heures , 
37 "O et hybrides (4 heures, 37 *C) dans une solution 
comprenant 15% (v/v) de formamide desionise, SSPE 2 X, 
20 solution de Denhardt 5 X, SDS 1 % (poids /volume) et 
de l'ADN de sperme de saumon denature (200 pg/ml) . 

Les filtres hybrides sont laves deux fois dans 
du SSPE 2 X et du SDS 0,1 % ( poids/volume) durant 10 
minutes a temperature ambiante; puis deux fois dans 
25 du SSPE 0,25 X, et du SDS 0,1 % (poids/volume) durant 
30 minutes a 37 'C puis une fois dans du SSPE 0,25 X 
durant 10 minutes a 37 *C 

lis sont ensuite exposes a des films sensibles 
aux rayons X ( Fuji ) a -70* C avec deux ecrans 
30 intensif iants . 

Un clone, appele P TaM1338, est isole et sa 
sequence est determinee sur les deux brins en 
utilisant la trousse de sequencage Taq Dye Deoxy 
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Terminator Cycle Sequencing kit commercialise par 
Applied Biosystems et le sequenceur 370 DNA 
automatique commercialise par Applied Biosystems. 

La sequence de l'ADN complementaire du clone 
5 pTaM1338 est la suivante : 
(SEQ ID N*7) 



CAAAGTGCGC GTGAGAAATA AGCGGTGCTT GCCCAGTAGA GAGAGAGAGA 
10 GAGAGAGAGA GAGATGGCGG CGTCGGCGGC GACGGCGACG GCGACGGCGG 

CGGCGGTAGG GGCGGGGGAG GTGATCTCCG TCCACAGCCT GGAGCAGTGG 
ACCATGCAGA TCGAGGAGGC CAACGCCGCC AAGAAGCTGG TGGTGATTGA 
CTTCACTGCA TCATGGTGCG GACCATGCCG CATTATGGCT CCAATTTTCG 
CTGATCTCGC CAAGAAGTTC CCAGCTGCTG TTTTCCTCAA GGTCGACGTT 
15 GATGAACTGA AGCCCATTGC TGAGCAATTC AGCGTGGAGG CCATGCCAAC 

CTTCCTGTTC ATGAAGGAAG GAGATGTCAA GGACAGGGTT GTCGGAGCTA 
TCAAGGAGGA ACTGACGACC AAGGTTGGGC TACACGCGGC CCAGTAATCA 
CCTACCGGAG TAGCATTCGC CTAAATAAAA TTGCCGCTCA ACAAGTAGTG 
CCTCTAATGG CACCTTATAT CCTGTGTACT GCTTGTTACT TGTTGGTTTA 
20 TGGATAATGG TGAATCAAGT GTGACTTTAT TCGGTAAATG GTTGATTTTC 

GTAAGGAGCT GATCGAATTC AGTTGTTCGG CTATAGGCAA AAAAAAAAAA 
AAAAAAAAA 



L' extremite 5 ' de cette sequence comprend une 
25 sequence de 63 paires de bases (pb) non codante, 
suivie d'une phase de lecture ouverte de 381 pb, puis 
d'une sequence non codante de 215 pb, a l'extremlte 
3' . 

La phase de lecture ouverte code pour une 
30 proteine de 127 acides amines de sequence SEQ ID N*2. 

La masse theorique de la proteine codee par 
cette phase de lecture ouverte est de 13524D. 
EXEMPLE 2 ; 

Obtention de clone de thioredoxine h de ble dur. 
35 1 > Construction de la banque d ' ADN 

complementaire de ble dur. 

La banque est obtenue de maniere similaire a 
celle de l'exemple 1 a l'exception du materiel vegetal 
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utilise qui est Triticum durum Desf. Variete Agathe. 
Les ARN totaux sont isoles de grains 22 jours apres 
f loraison. 

Les ARN messagers isoles par chromatographie 
d'af finite sur oligo dT cellulose sont clones dans le 
plasmide pUC118 dans le site de clonage Pstl. 

La souche d • Escherichia coli JM109 est 
trans formee avec les plasmides obtenus . 

La methode de fabrication de cette banque d'ADN 
complementaire est mise en oeuvre de la maniere 
decrite par Gautier et al . (Plant Molecular Biology, 
14, 313-322, 1990) dont la publication est incluse par 
reference a la presente demande. 

2. Isolement d'un clone codant eour une 

15 thloredoxine h de ble dur. 

Des clones sont cribles conune indique dans 
l'exemple 1 par le meme melange d ' oligonucleotides de 
synthese ( SEQ ID N* 6). 

Un clone, denomme pTdl4132 est isole et sa 
20 sequence est determinee conune indique dans l'exemple 
1. 

Ce clone comprend la sequence d'ADN 
complementaire de ble dur suivante : 

25 SEQ ID N*8 

CGTGAGAAAT AAGCGGTGCT TGCCAAGCAG AGAGAGAGAG AGAGAGAGAG 
ATGGCGGCGG CGGCGACGGC GACGACTACA GCGGCGGC G A CGGCGGCGGC 
GGTGGGGCCG GGGGAGGTGA TCTCCGTCCA CAGCCTGGAG CAGTGGACCA 
30 TGCAGATCGA GGAGGCCAAC GCCGCCAAGA AGCTGGTGGT GATTGACTTC 
ACTGCATCAT GGTGCGGACC ATGCCGCATC ATGGCTCCAA TTTTTGCTGA 
TCTCGCCAAG AAGTTCCCAG CTGCTGTTTT CCTCAAGGTC GACGTTGATG 
AACTGAAGCC CATTGCTGAG CAATTCAGCG TCGAGGCCAT GCCAACCTTC 
CTGTTCATGA AGGAAGGAGA CGTCAAGGAC AGGGTTGTCG GAGCTATCAA 
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GGAGGAGCTG ACGACCAAGG TTGGGCTCCA CGCGGCTGCC TAGTAATCAC 
CTAGCGGAGT AGTATTCGCC TAAATAAAAT TGCCGCTTGA GAAGTAGTGC 
CTCCAATGGC ACCGGATATG CTGTGTACTG CTTGCTTCTT GTGAGTTTAT 
GGATGATGGT GAATCAAGTG TGACTTTATT CGGTAAATGG TTGATTTCAT 
5 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 

L'extremite 5' de cette sequence comprend une 
partie non codante de 50 bp, puis une phase de lecture 
ouverte de 390 pb puis une partie non codante de 190 
pb a son extremite 3'. 
10 La phase de lecture ouverte correspond a une 

proteine de 130 acides amines , ayant une masse 
moleculaire theorique de 13750D. 
EXEMPLE 3 : 

Comparaison des structures primaires des thioredoxines 
15 h de bles dur et tendre et des autres thioredoxines h 
divulcruees dans l'etat de la technique. 

Les structures primaires des deux proteines 
correspondant aux clones pTaM1338 et pTdl4132 ont ete 
comparees entre el les et aux structures primaires de 
20 thioredoxines h de riz ( THIORIZ), de thioredoxine h 
d'Arabidopsis (THIOARA) , de thioredoxine h2 de tabac 
(THIOTABAC 2), de thioredoxine hi de tabac (THIOTABAC) 
et de thioredoxine h de Chlamydomonas reinhardtii 
(THIOCHLA) . 

25 Les resultats de ces comparaisons sont repris 

dans la figure 1. 

Dans cette figure les acides amines sont 
representes par le code a une lettre et (*) represente 
une position d'acide amine identique dans les sept 
30 proteines, tandis que (.) represente une position 
d ' acide amine similaire . 

Sur une longueur totale de 138 acides amines, 
on observe une conservation a 1 1 identique pour 31 
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acides amines (22,5 %) et une similarity pour 42 
acides amines ( 30,4 %). 

II ressort done clairement de cette figure que 
les thioredoxines h de bles montrent une faible 
5 identite de sequence avec les autres thioredoxines h 
de vegetaux deja sequences. 

De maniere surprenante, 1 ' identite de sequence 
entre d'une part la thioredoxine h de riz et d' autre 
part les thioredoxines h de ble tendre et de ble dur 
10 n'est que de respectivement 54,9% et 55,7 %, alors que 
ces plantes sont toutes trois des graminees. 
EXEMPLE 4; 

Production de thioredoxine h par des bact eries. 

1. Sous-clonaoe de la sequence codant pour la 
15 thioredoxine h ble tendre dans un vecteur 

d'expression d'E.coli; 

Le DNA plasmidique pTAM1338 contenant la 

sequence d'ADNc codant pour la thioredoxine h de ble 

tendre (Triticum aestivum) a ete modifie par 
20 mutagenese dirigee pour introduire les sites de 

restriction Ndel et BamHI respectivement en 5' et 3' 

de la sequence codant pour la proteine. 

Ces sites de restriction ont ensuite servi a 

introduire la sequence codant pour la thioredoxine h 
25 de ble tendre (Triticum aestivum) dans le vecteur 

d'expression pET3b commercialise par Novagen (USA) et 

decrit par Rosenberg et al., (Gene, 56, 125-135, 1987) 

digere par les memes enzymes . 

La figure 2 illustre cette construction. 
30 Le vecteur pET3b est une molecule d'ADN 

circulaire derive de pBR322; il contient les elements 

suivants : 

- le promoteur du gene 10 reconnu par l'ARN 
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polymerase T7 (appele PO10) contenu entre les sites de 
restriction Bglll et Xbal, 

- la sequence Shine-Dalgarno du gene 10, 

- un codon d f initiation ATG contenu dans le 
5 site unique de restriction Ndel en 5* des premiers 

codons du gene 10/ 

un site de restriction unique BamHI qui 

permet de doner une sequence d'un gene etranger dans 

le vecteur d ' expression, 
10 - le terminateur de transcription qui suit 

normalement le gene 10(TO). 

Ce vecteur possede le replicon pMBl (ori) et 

contient le gene bla qui code pour la resistance a 

1 ' ampiciline (ampR) . 
15 La sequence codant pour la thioredoxine h de 

ble tendre incluse entre les sites de restriction Ndel 

et BamHI qui ont ete crees par mutagenese dirigee est 

introduite dans le vecteur d 1 expression digere par les 

memes enzymes . 

20 Le vecteur resultant pETtrxTa est utilise pour 

transformer des souches d'E. coli. 

Les methodes conventionnelles de clonage ont 
ete utilisees. Elles sont decrites par Maniatis et al. 
( 19 82) . Molecular Cloning: A Laboratory Manual, 2nd 
25 Ed., Cold Spring Harbor Laboratory, New York. 

Le plasmide pETtrxTa resultant de la 
construction a ete sequence comme decrit par Sanger et 
al. (1977, Proc. Natl. Acad. Sci. USA 74, 5463-5467), 
dans le but de verifier qu'aucune mutation n'a ete 
30 introduite dans la sequence de la thioredoxine h au 
cours de 1 ' amplification ou du clonage. 

La sequence codant pour la thioredoxine h peut 
aussi etre introduite dans le vecteur d' expression 
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apres modification, par mutagenese dirigee, d'un ou 
plusieurs acides amines de la proteine dans le but de 
changer ses proprietes . Les methodes conventionnelles 
de mutagenese dirigee sont decrites par Maniatis et 
5 al. (1982, precedemment cite). 

2. obtentlon de bacteri es orodulsant — de — la 

thioredoxine h: 

Le vecteur pETtrxTa qui contient la sequence 
codant pour la thioredoxine h de ble sous controle du 

10 promoteur reconnu par l'ARN polymerase du 
bacteriophage T7 est utilise pour transformer des 
souches d'E. coli (Hanahan et al . , 1985, Technique for 
transformation of E. coli in "DNA Cloning: A practical 
Approach "(Glover , D.M.Ed. Vol.1, pp 109-135, IRL 

15 Press, Oxford), capables de synthetiser l'ARN 
polymerase T7 . De telles souches sont commercialisees 
par Novagen (USA) et decrites par Studier et al . , 
(1990, Methods Enzymol. 185, 60-89). Elles peuvent 
etre : 

20 -BL21 (DE3): ompT hsdS gal ( lambda clts857 

indl Sam7 nin5 lacUV5-T7 genel), 

-BL.21 ( DE3 ) pLysE : meme genotype que BL21 (DE3) 
excepte le plasmide pLysE qui derive du plasmide 
PACYC184 (Chang et al . , 1978 , J. Bacterid. 134-1141) 

25 et contient le gene codant pour le lysozyme T7 ainsi 
que le gene de resistance au chloramphenicol. Le gene 
codant pour le lysozyme est exprime a partir du 
promoteur tet de pACYC184 ce qui signifie que les 
bacteries qui portent ce plasmide accumulent un taux 

30 important de lysozyme. 

-BL21 (DE3)pLysS: meme genotype que BL2 1 
( DE3 ) pLysE mais le gene codant pour le lysozyme est 
insere dans 1 ' orientation opposee. En consequence, les 
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bacteries qui portent ce plasmide accumulent une 
quantite beaucoup plus faible de lysozyme. 

Les bacteries transformees sont multipliees 
dans le milieu de Luria-Bertani avec les antibiotiques 
5 necessaires, a 30"C. 

3 . Analyse de 1' expression de la thioredoxine h 
dans les bacteries. 

Les bacteries contenant le vecteur pETtrxTa 
sont cultivees jusqu'a une densite optique comprise 
10 entre 0,3 et 0,6 a 600 nm, (une fraction aliquote 
avant induction est conservee pour analyse) . 
L'inducteur de 1' expression de l'ARN polymerase T7 
(IPTG 0.1 mM) est alors ajoute au milieu de culture 
pour permettre 1' expression de la thioredoxine h et 
15 les bacteries sont collectees par centrif ugation apres 
3 ou 6 h d' induction. 

Les bacteries induites sont lysees par les 
methodes convent ionnelles et le lysat contenant les 
proteines totales est centrifuge pour separer la 
20 fraction "proteines insolubles" (culot) de celle des 
"proteines solubles" { surnageant) . 

Le surnageant qui contient l'activite 
thioredoxine h, identifiee par dosage de la reduction 
de la malate dehydrogenase comparable au temoin 
25 extrait de ble, est chauffe a 60*C (5 min.) et 
centrifuge pour separer la fraction des proteines 
thermostables (surnageant) des autres proteines. 

Les echantillons des differentes fractions sont 
traites avec le tampon de charge de Laemlli (Laemlli, 
30 1970, Nature, 227, 680-685), chauffe 5 a 10 minutes 
dans un bain marie bouillant et analyse par gel de 
sodium dodecyl sul f ate-polyacrylamide . 

Une proteine de la taille attendue pour une 
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thioredoxlne h de ble est presente dans le lysat des 
proteines totales de bacteries induites et reste 
soluble meme apres chauffage a 60*C; le meme gel est 
transfere sur une membrane de nitrocellulose (Towbin 
et al., 1979/ Proc. Natl. Acad. Sci. USA 76, 435P- 
4 354) /et incube avec un anticorps dirige centre la 
thioredoxlne h de ble. La proteine, de taille 
attendue, synthetisee dans le cytoplasme bacterien 
apres induction, reagit avec 1 ' anticorps . 

Les figures 3 et 4 representent respectivement 
un gel de polyacrylamide-SDS apres coloration au bleu 
de Coomassie et un Western-Blot effectue avec un 
anticorps dirige centre la thioredoxine h de ble, de : 

1. lysat de bacteries avant induction, 

2. culot des proteines insolubles du lysat 

apres 3h d* induction, 

3. culot apres chauffage des proteines solubles 

du lysat, 

4. surnageant apres chauffage des proteines 

20 solubles du lysat, 

5. comme 2 apres 6h d' induction, 

6. comme 3 apres 6h d' induction, 

7. comme 4 apres 6h d' induction. 

a Purification de la thiored oxlne h de ble. 
Les conditions de purification utilisees 
suivent essentiellement le protocole decrit par de 
Lamotte-Guery et al., ((1991) Eur. J. Biochem. 196, 
287-294). Les bacteries sont recoltees apres induction 
de 4h selon les conditions decrites plus haut et 
resuspendues dans un tampon 30 mM Tris/HCl pH 7 , 9 et 1 

mM EDTA (tampon A) . 

Apres un cycle de congelation (- 
20'0/decongelation les cellules sont lysees avec une 
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presse de French et le lysat ainsi obtenu est 
centrifuge a 4*C, 30 minutes a SO OOO g pour recuperer 
la fraction surnageante qui est ensuite chauffee a 
60*C, 5 minutes. 
5 Les proteines denaturees par le traitement a 

chaud sont centrifugees comme precedemment • Le 
surnageant contient principalement la thioredoxine h. 
Elle peut etre purifiee par precipitation au sulfate 
d' ammonium (35-80 %) suivie d'une chromatographie 

10 d' exclusion (Sephadex G-50) et d'une chromatographie 
echangeuse d'ions (Q-Hyper D) . 

Cette derniere chromatographie est realisee 
avec un gradient de O a 200 mM NaCl, la thioredoxine h 
de ble produite dans E.coli est eluee a une 

15 concentration de 90 mM NaCl . La mesure de l'activite 
de la thioredoxine h (mesure de 1' activation de la 
malate dehydrogenase a NADP selon Jacquot et 
al.((1981), Plant Physiol., 68, 300-304) a chaque 
etape aide a suivre la purification. 

20 EXEMPLE 5 : Production de thioredoxine h par des 
levures . 

1. Construction de pFL61trxTa; 

Le fragment correspondant a la sequence codante 
de pTaM1388 est amplifie en utilisant deux 
25 oligonucleotides de synthese s'hybridant aux regions 
15-34 et 482-502 et un site de restriction NotI est 
ajoute a chaque extremite. 

Le fragment resultant est insere dans le 
vecteur pFL61 represents sur la figure 5 ( Lacroute, 
30 (1992) Plant J. 2 (3), 417-422) prealablement linearise 

par NotI. 

Le sens d' insertion et la sequence sont 
controles. Le vecteur resultant est appele pFL61trxTa. 
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2. Construction de pVTUtrxTa; 

La sequence de l'ADNc codant pour la 
thioredoxine h de ble tendre issue de P TaM1338 est 
isolee apres digestion par BamHI et Ndel du plasmide 
5 pETtrxTa (plasmide pET portant la sequence codante de 
P TaM1338) puis inseree dans le vecteur pVTUtrxTa 
represents sur la figure 6, (Vernet et al . (1987) Gene 
52, 225-233 ) au niveau du site de clonage Pvu II. Le 
vecteur resultant est appele pVTUtrxTa. 
10 3. conditions de purif ication; 

Les levures (souche OL1 et YPH 250) sont 
trans formees par pVTUtrxTa et sont cultivees en milieu 
liquide a 30*C et en conditions selectives, permettant 
le maintien des plasmides dans les cellules jusqu'a 
15 une absorbance a 550 nm de 1, puis sont transferees en 
milieu riche pendant 16 heures . 

Ceci permet d ' augmenter la biomasse et le 
faible nombre de divisions ayant lieu pendant cette 
duree de temps limite les effets de perte de plasmide. 
20 Les cellules sont ensuite cassees par passage dans un 
broyeur a billes ou par incubation dans de 
l'ammoniaque. Les conditions de purification de la 
proteine recombinante a partir du lysat cellulaire 
sont celles decrites par de Lamotte et al . ( (1991). 
25 Eur. J- Biochem. 196, 287-294). 

Les deux souches de levures trans formees 
produisent des thioredoxines h decelables par 
immunoempreintes . 

La souche YPH252 deposee a l'ATCC peut aussi 

30 etre utilisee. 
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LISTE DE SEQUENCES 



(1) INFORMATION GENERALE : 



(i) DEPOSANT: 

(A) NOM: Institut National de la Recherche Agronomique 

INRA 

(B) RUE: 147 rue de l'universite 

(C) VILLE: Paris 

(E) PAYS: France 

(F) CODE POSTAL: 75348 

(li) TITRE DE L' INVENTION: Thioredoxines h de ble tendre et de ble dur 
et proteines presentant des similitudes; fragments d ' ADN 
codant pour ces proteines et proc§des d'obtentlon 

(lii) NOMBRE DE SEQUENCES: 8 

(iv) FORME LISIBLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D* EXPLOITATION: PC -DOS /MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.25 (OEB) 

(2) INFORMATION POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 109 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE : peptide 

(iii) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISME: Triticum aestivum 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

Gly Glu Val lie Ser Val His Ser Leu Glu Gin Trp Thr Met Gin lie 
15 10 15 

Glu Glu Ala Asn Ala Ala Lys Lys Leu Val Val He Asp Phe Thr Ala 
20 25 30 

Ser Trp Cys Gly Pro Cys Arg He Met Ala Pro He Phe Ala Asp Leu 
35 40 45 

Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp Glu 
50 55 60 

Leu Lys Pro He Ala Glu Gin Phe Ser Val Glu Ala Met Pro Thr Phe 
65 70 75 80 
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Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg Val Val Gly Ala lie 
85 90 95 

Lys Glu Glu Leu Thr Thr Lys Val Gly Leu His Ala Ala 
100 105 

(2) INFORMATION POUR LA SEQ ID NO: 2: 

(I) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 384 palres de bases 

(B) TYPE: aclde nucleique 

(C) NOMBRE DE BRINS: deux 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc pour ARNm 

(III) HYPOTHETIQUE : NON 

(vl) ORIGINE: 

(A) ORGANISME: Triticum aestivum 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1..381 



(xl) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

ATG GCG GCG TCG GCG GCG ACG GCG ACG GCG ACG GCG GCG GCG GTA GGG 4 8 

Met Ala Ala Ser Ala Ala Thr Ala Thr Ala Thr Ala Ala Ala Val Gly 

15 10 15 

GCG GGG GAG GTG ATC TCC GTC CAC AGC CTG GAG CAG TGG ACC ATG CAG 9 6 

Ala Gly Glu Val lie Ser Val His Ser Leu Glu Gin Trp Thr Met Gin 

20 25 30 

ATC GAG GAG GCC AAC GCC GCC AAG AAG CTG GTG GTG ATT GAC TTC ACT 14 4 

lie Glu Glu Ala Asn Ala Ala Lys Lys Leu Val Val lie Asp Phe Thr 

35 40 45 

GCA TCA TGG TGC GGA CCA TGC CGC ATT ATG GCT CCA ATT TTC GCT GAT 192 

Ala Ser Trp Cys Gly Pro Cys Arg lie Ket Ala Pro lie Phe Ala Asp 

50 55 60 

CTC GCC AAG AAG TTC CCA GCT GCT GTT TTC CTC AAG GTC GAC GTT GAT 24 0 

Leu Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp 

65 70 75 80 

GAA CTG AAG CCC ATT GCT GAG CAA TTC AGC GTG GAG GCC ATG CCA ACC 288 

Glu Leu Lys Pro lie Ala Glu Gin Phe Ser Val Glu Ala Ket Pro Thr 

85 90 95 

TTC CTG TTC ATG AAG GAA GGA GAT GTC AAG GAC AGG GTT GTC GGA GCT 336 

Phe Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg Val Val Gly Ala 

100 105 110 
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ATC AAG GAG GAA CTG ACG ACC AAG GTT GGG CTA CAC GCG GCC CAG 
lie £s Glu Glu Leu Thr Thr Lys Val Gly Leu His Ala Ala Gin 
115 120 125 



TAA 



(2) INFORMATION POUR LA SEQ ID NO: 3: 

(1) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 127 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

-a Ala Thr Ala Thr Ala Thr Ala Ala Ala Val Gly 
5 10 15 

« der Val- His Ser Leu Glu Gin Trp Thr Met Gin 



Met 
1 


Ala 


Ala 


Ser 


Ala 


Gly 


Glu 


Val 
20 


He 


Glu 


Glu 
35 


Ala 


Ala 


Ser 
50 


Trp 


Cys 


Leu 
65 


Ala 


Lys 


Lys 


Glu 


Leu 


Lys 


Pro 


Phe 


Leu 


Phe 


Met 
100 


He 


Lys 


Glu 
115 


Glu 



25 30 

Ma Lys Lys Leu Val Val lie Asp 
40 45 

-vs Arg He Ket Ala Pro He Phe 
55 60 



Leu Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val Asp Val Asp 



Cle Aia biu oiii w><=^ 

85 90 95 



Phe Leu Phe Ket Lys Glu Gly Asp Val Lys Asp Arg Val Val Gly Al 
100 105 

u Thr Thr Lys Val Gly Leu His Ala Ala Gin 
120 125 

(2) INFORMATION POUR LA SEQ ID NO: 4: 

(i) CARACTERI STIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 393 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: deux 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc pour ARNm 

(iii) HYPOTHETIQUE: NON 

(vi ) ORIGINE: 

(A) ORGAN I SHE: Triticum durum 



381 



384 
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(ix) CARACTERISTIQUE ADDITIONELLE : 
(A) NOM/CLE: CDS 
{ B ) EMPLACEMENT: 1..3 90 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

S5 S S !K S JS S SS S5 iS ??? SS S J2 S K 
S SI? S SfS S? SS SI? SS E SI? SS iS 2S SS SS S 
S SIS S|| JK SS SS S SS S SSS "S ss si? SI? til 

SS 52 s s: S 2S ss ss ss ss 2S S "« ??i S ill 

50 55 * 

SI ??I E 2S SSS SS S! £ "I K ™ ™ 25 S £ 



65 



2S ss 2; as 2; ss ss in E SS Si SS SSS SI? ss s?s 

85 9U 

ATG CCA ACC TTC CTG TTC ATG AAG GAA GGA GAC GTC AAG GAC AGG GTT 
E? Pro Thr pTe Su Phe Met Lys Glu Gly Asp V.I Vys Asp Arg Val 
100 105 

SI? SS S ilS £S SS SS 2S JS 5SS SS SII SS SS SS SSS 

GCT GCC TAG 
Ala Ala 
130 



48 



96 



144 



192 



240 



288 



336 



384 



393 
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(2) INFORMATION POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 130 acldes amines 

(B) TYPE: aclde amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

Met Ala Ala Ala Ala Thr Ala Thr Thr Thr Ala Ala Ala Thr Ala Ala 
X 5 10 15 

Ala Val Gly Pro Gly Glu Val lie Ser Val His Ser Leu Glu Gin Trp 
20 25 30 

Thr Met Gin He Glu Glu Ala Asn Ala Ala Lys Lys Leu Val Val He 
35 40 45 

Asp Phe Thr Ala Ser Trp Cys Gly Pro Cys Arg He Met Ala Pro He 
50 55 60 

Phe Ala Asp Leu Ala Lys Lys Phe Pro Ala Ala Val Phe Leu Lys Val 
65 70 75 80 

Asp Val Asp Glu Leu Lys Pro He Ala Glu Gin Phe Ser Val Glu Ala 
85 90 95 

Met Pro Thr Phe Leu Phe Met Lys Glu Gly Asp Val Lys Asp Arg Val 
100 105 110 

Val Gly Ala He Lys Glu Glu Leu Thr Thr Lys Val Gly Leu His Ala 
115 120 125 

Ala Ala 
130 

(2) INFORMATION POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: un 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
(iii) HYPOTHETIQUE : NON 

(v) TYPE DU FRAGMENT: interne 



(ix) CARACTER I ST I QUE ADDITIONELLE : 
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(A) NOM/CLE: variation 

(B) EMPLACEMENT: remplace{6, "t") 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: variation 

(B) EMPLACEMENT: remplace(9, t# a M ) 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace(12, "g") 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace(12, "c n ) 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace(12, "t") 

(ix) CARACTERISTIQUE ADDITIONELLE: 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: remplace(15, "t") 

(ix) CARACTERISTIQUE ADDITIONELLE : 

(A) NOM/CLE: mutation 

(B) EMPLACEMENT: rempl ace ( 1 8 , "a") 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
TGGTGCGGTC CATGCAAGAT G 
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(2) INFORMATION POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 659 paires do bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS : deux 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNC pour ARNm 

(iii) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISME: Triticum aestivum 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID 


NO: 7 : 






CAAAGTGCGC 


GTGAGAAATA 


AGCGGTGCTT 


GCCCAGTAGA 


GAGAGAGAGA 


GAGAGAGAGA 


60 


GAGATGGCGG 


CGTCGGCGGC 


GACGGdGACG 


GCGACGGCGG 


CGGCGGTAGG 


GGCGGGGGAG 


120 


GTGATCTCCG 


TCCACAGCCT 


GGAGCAGTGG 


ACCATGCAGA 


TCGAGGAGGC 


CAACGCCGCC 


180 


AAGAAGCTGG 


TGGTGATTGA 


CTTCACTGCA 


TCATGGTGCG 


GACCATGCCG 


CATTATGGCT 


240 


CCAATTTTCG 


CTGATCTCGC 


CAAGAAGTTC 


CCAGCTGCTG 


TTTTCCTCAA 


GGTCGACGTT 


300 


GATGAACTGA 


AGCCCATTGC 


TGAGCAATTC 


AGCGTGGAGG 


CCATGCCAAC 


CTTCCTGTTC 


360 


ATGAAGGAAG 


GAGATGTCAA 


GGACAGGGTT 


GTCGGAGCTA 


TCAAGGAGGA 


ACTGACGACC 


420 


AAGGTTGGGC 


TACACGCGGC 


CCAGTAATCA 


CCTACCGGAG 


TAGCATTCGC 


CTAAATAAAA 


480 


TTGCCGCTCA 


ACAAGTAGTG 


CCTCTAATGG 


CACCTTATAT 


CCTGTGTACT 


GCTTGTTACT 


540 


TGTTGGTTTA 


TGGATAATGG 


TGAATCAAGT 


GTGACTTTAT 


TCGGTAAATG 


GTTGATTTTC 


600 


GTAAGGAGCT 


GATCGAATTC 


AGTTGTTCGG 


CTATAGGCAA 


AAAAAAAAAA 


AAAAAAAAA 


659 



(2) INFORMATION POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 630 paires de bases 

(B) TYPE: acide nucleique 

(C) NOMBRE DE BRINS: deux 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc pour ARNm 

{iii) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISME: Triticum durum 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 



C GT. wAVjAAA i. 


njy\3 ww a * 


TGCCAAGCAG 


AGAGAGAGAG 


AGAGAGAGAG 


ATGGCGGCGG 


60 


CGGCGACGGC 


GACGACTACA 


GCGGCGGCGA 


CGGCGGCGGC 


GGTGGGGCCG 


GGGGAGGTGA 


120 




CAGCCTGGAG 


CAGTGGACCA 


TGCAGATCGA 


GGAGGCCAAC 


GCCGCCAAGA 


180 


AGCTGGTGGT . 


GATTGACTTC 


ACTGCATCAT 


GGTGCGGACC 


ATGCCGCATC 


ATGGCTCCAA 


240 


TTTTTGCTGA 


TCTCGCCAAG 


AAGTTCCCAG 


CTGCTGTTTT 


CCTCAAGGTC 


GACGTTGATG 


300 


AACTGAAGCC 


CATTGCTGAG 


CAATTCAGCG 


TCGAGGCCAT 


GCCAACCTTC 


CTGTTCATGA 


360 


AGGAAGGAGA 


CGTCAAGGAC 


AGGGTTGTCG 


GAGCTATCAA 


GGAGGAGCTG 


ACGACCAAGG 


420 


TTGGGCTCCA 


CGCGGCTGCC 


TAGTAATCAC 


CTAGCGGAGT 


AGTATTCGCC 


TAAATAAAAT 


480 


TGCCGCTTGA 


GAAGTAGTGC 


CTCCAATGGC 


ACCGGATATG 


CTGTGTACTG 


CTTGCTTCTT 


540 


GTGAGTTTAT 


GGATGATGGT 


GAATCAAGTG 


TGACTTTATT 


CGGTAAATGG 


TTGATTTCAT 


600 


AAAAAAAAAA 


AAAAAAAAAA 


AAAAAAAAAA 








630 
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RE VEND I CAT I ONS 
1. Proteine presentant une similitude de 
sequence d'au moins 65% avec la sequence SEQ ID N" 1 
suivante : 

5 



Gly 


Glu 


Val 


He 


Ser 


Val 


His 


Ser 


Leu 


Glu 


Gin 


Trp 


Thr 


Met 


Gin 


He 


Glu 


Glu 


Ala 


Asn 


Ala 


Ala 


Lys 


Lys 


Leu 


Val 


Val 


He 


Asp 


Phe 


Thr 


Ala 


Ser 


Trp 


Cys 


Gly 


Pro 


Cys 


Arg 


He 


Met 


Ala 


Pro 


He 


Phe 


Ala 


Asp 


Leu 


Ala 


Lys 


Lys 


Phe 


Pro 


Ala 


Ala 


Val 


Phe 


Leu 


Lys 


Val 


Asp 


Val 


Asp 


Glu 


Leu 


Lys 


Pro 


He 


Ala 


Glu 


Gin 


Phe 


Ser 


Val 


Glu 


Ala 


Met 


Pro 


Thr 


Phe 


Leu 


Phe 


Met 


Lys 


Glu 


Gly 


Asp 


Val 


Lys 


Asp 


Arg 


Val 


Val 


Gly 


Ala 


He 


Lys 


Glu 


Glu 


Leu 


Thr 


Thr 


Lys 


Val 


Gly 


Leu 


His 


Ala 


Ala 



















15 2 . Proteine selon la revendication 1 

caracterisee en ce qu'elle presente une similitude de 
sequence avec la sequence SEQ ID N*l d'au moins 75 % 
et pref erentiellement d'au moins 85 %. 

3. Thioredoxine h de ble tendre selon l'une des 

20 revendications 1 et 2 presentant la sequence suivante: 
SEQ ID N*3 



Met 


Ala 


Ala 


Ser 


Ala 


Ala 


Thr 


Ala 


Thr 


Ala 


Thr 


Ala 


Ala 


Ala 


Val 


Gly 


Ala 


Gly 


Glu 


Val 


He 


Ser 


Val 


His 


Ser 


Leu 


Glu 


Gin 


Trp 


Thr 


Met 


Gin 


He 


Glu 


Glu 


Ala 


Asn 


Ala 


Ala 


Lys 


Lys 


Leu 


Val 


Val 


He 


Asp 


Phe 


Thr 


Ala 


Ser 


Trp 


Cys 


Gly 


Pro 


Cys 


Arg 


He 


Met 


Ala 


Pro 


He 


Phe 


Ala 


Asp 


Leu 


Ala 


Lys 


Lys 


Phe 


Pro 


Ala 


Ala 


Val 


Phe 


Leu 


Lys 


Val 


Asp 


Val 


Asp 


Glu 


Leu 


Lys 


Pro 


He 


Ala 


Glu 


Gin 


Phe 


Ser 


Val 


Glu 


Ala 


Met 


Pro 


Thr 


Phe 


Leu 


Phe 


Met 


Lys 


Glu 


Gly 


Asp 


Val 


Lys 


Asp 


Arg 


Val 


Val 


Gly 


Ala 


He 


Lys 


Glu 


Glu 


Leu 


Thr 


Thr 


Lys 


Val 


Gly 


Leu 


His 


Ala 


Ala 


Gin 
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4. Thioredoxine h de ble dur selon l'une des 
revendications 1 et 2 presentant la sequence suivante: 
SEQ ID N*5 

5 Met Ala Ala Ala Ala Thr Ala Thr Thr Thr Ala Ala Ala 
Thr Ala Ala Ala Val Gly Pro Gly Glu Val He Ser Val 
His Ser Leu Glu Gin Trp Thr Met Gin He Glu Glu Ala 
Asn Ala Ala Lys Lys Leu Val Val He Asp Phe Thr Ala 
Ser Trp Cys Gly Pro Cys Arg He Met Ala Pro He Phe 

10 Ala Asp Leu Ala Lys Lys Phe Pro Ala Ala Val Phe Leu 
Lys Val Asp Val Asp Glu Leu Lys Pro He Ala Glu Gin 
Phe Ser Val Glu Ala Met Pro Thr Phe Leu Phe Met Lys 
Glu Gly Asp Val Lys Asp Arg Val Val Gly Ala He Lys 
Glu Glu Leu Thr Thr Lys Val Gly Leu His Ala Ala Ala 

15 5. peptide comprenant au moins un fragment 

d-une des proteines selon l'une des revendications 1 
et 4. 

6. Fragment d'ADN codant pour une des proteines 
selon l'une quelconque des revendications 1 a 4 ou un 

20 des peptides selon la revendication 5. 

7. Fragment selon la revendication 6 codant 
pour la thioredoxine h de ble tendre, caracterise en 
ce qu'il comprend la sequence suivante : 

SEQ ID N*2 

25 

ATGGCGGCGT CGGCGGCGAC GGCGACGGCG ACGGCGGCGG CGGTAGGGGC 
GGGGGAGGTG ATCTCCGTCC ACAGCCTGGA GCAGTGGACC ATGCAGATCG 
AGGAGGCCAA CGCCGCCAAG AAGCTGGTGG TGATTGACTT CACTGCATCA 
TGGTGCGGAC CATGCCGCAT TATGGCTCCA ATTTTCGCTG ATCTCGCCAA 
30 GAAGTTCCCA GCTGCTGTTT TCCTCAAGGT CGACGTTGAT GAACTGAAGC 

CCATTGCTGA GCAATTCAGC GTGGAGGCCA TGCCAACCTT CCTGTTCATG 
AAGGAAGGAG ATGTCAAGGA CAGGGTTGTC GGAGCTATCA AGGAGGAACT 
GACGACCAAG GTTGGGCTAC ACGCGGCCCA GTAA 



BNSDOCID: <WO 9603505A1.U 



WO 96/03505 




PCT/FR95/01005 



8. Fragment selon la revendication 6 codant 
pour la thioredoxlne h de ble dur, caracterise en ce 
qu'il comprend la sequence suivante : 

SEQ ID N # 4 

5 

ATGGCGGCGG CGGCGACGGC GACGACTACA GCGGCGGCGA CGGCGGCGGC 
GGTGGGGCCG GGGGAGGTGA TCTCCGTCCA CAGCCTGGAG CAGTGGACCA 
TGCAGATCGA GGAGGCCAAC GCCGCCAAGA AGC TGGTGGT GATTGACTTC 
ACTGCATCAT GGTGCGGACC ATGCCGCATC ATGGCTCCAA TTTTTGCTGA 
10 TCTCGCCAAG AAGTTCCCAG CTGCTGTTTT CCTCAAGGTC GACGTTGATG 

AACTGAAGCC CATTGCTGAG CAATTCAGCG TCGAGGCCAT GCCAACCTTC 
CTGTTCATGA AGGAAGGAGA CGTCAAGGAC AGGGTTGTCG GAGCTATCAA 
GGAGGAGCTG AC G AC C AAGG TTGGGCTCCA CGCGGCTGCC TAG 

9. Vecteur nucleotidique portant un fragment 
15 d'ADN selon l'une des revendications 6 a 8. 

10. Vecteur appele pETtrxTa selon la 
revendication 9 portant la sequence SEQ ID N*2, depose 
aupres de la CNCM sous le n* 1-1442. 

11. Vecteur appele pFL61trxTa selon la 
20 revendication 9 portant la sequence SEQ ID N"2, depose 

aupres de la CNCM sous le n" 1-1443. 

12 . Microorganisme portant un vecteur selon 
l'une des revendications 9 a 11. 

13. Microorganisme selon la revendication 12 
25 caracterise en ce qu'il est une bacterie ou une 

levure . 

14. Methode de selection dans une banque d'ADN 
complementaires de clones codant pour une thioredoxlne 
h caracterisee en ce que 1 ' on hybride lesdits clones 

30 avec une sonde presentant une similitude de sequences 
proche de 100 % avec le site actif des thioredoxines . 

15. Methode selon la revendication 14 
caracterisee en ce que ladite sonde presente la 
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sequence suivante : 
SEQ ID N*6 

TGGTGX 1 GGX 2 CCX 3 TGX 4 AAX 5 ATG 
dans laquelle : 
5 X 1 represente C ou T 

X 2 represente T ou A 

X 3 represente A, G, C ou T 

X 4 represente C ou T 

X 5 represente G ou A 
10 is. Procede de production de proteines et de 

peptides selon rune des revendications 1 a 5 , et en 
particulier de thioredoxines h comprenant les etapes 
suivantes : 

- culture d'un microorganisme selon l'une des 
15 revendications 12 et 13 , et 

- isolement des proteines ou peptides selon 
1-une des revendications 1 a 5 produits par ledit 

microorganisme. 

17 . Procede selon la revendication 16 
20 caracterise en ce que les microorganismes sont lyses 

apres culture . 

18. Plante transgenique caracterisee en ce 
qu'elle porte un fragment d'ADN selon l'une des 
revendications 6 a 8 . 

25 
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THIOBLETA MAASAA TATATAAA VG AG E V I S VH S LEQWTMQ I EE ANAAKKL W I DFTA S WC 

THIOBLETD MAAAATATTTAAATAAA VG PG E V I S VH S LEQWTMQ I EE ANAAKKL W I DFTA S WC 

TH I OR 1 2 MAA EE GW I AC HNKDEFDAQMTKAKEAGK W 1 1 DFTA S WC 

THIOARA MA SEE GQVIACHTVETWNEQLQKANESKTLVWDFTASWC 

TH I OTABAC2 MA EE GQVIGVHTVDAWNEHLQKGIDDKKLIWDFTASWC 

TH I OTABAC MAANDATS SEE GQVFGCHKVEEWNE YFKKGVETKKLVWDFTASWC 

THIOCHLA GGS VI VIDSKAAWDAQLAKGKEEHK PI WDFTATWC 

* * ...****.** 

THIOBLETA GPCRIMAPIFADLAKKFPA-AVFLKVDVDELKPIAEQFSVEAMPTFLFMKEGDVK 

THIOBLETD GPCRIMAPIFADLAKKFPA-AVFLKVDVDELKPIAEQFSVEAMPTFLFMKEGDVK 

THIORIZ GPCRFIAPVFAEYAKKFPG-AVFLKVDVDELKEVAEKYNVEAMPTFLFIKDGAEA 

THIOARA GPCRFIAPFFADLAKKLPN-VLFLKVDTDELKSVASDWAIQAMPTFMFLKEGKIL 

TH I OTABAC 2 GPCKFIASFYAELAKKMPT-VTFLRVDVDELKSVATDWAVEAMPTFMFLKEGKIV 

THIOTABAC GPCRFIAPILADIAKKMPH- VIFLKVDVDELKTVSAEWSVEAMPTFVFIKDGKEV 

THIOCHLA GPCKMIAPLFETLSNDYAGKVIFLKVDVDAVAAVAEAAGITAMPTFHVYKDGVKA 
*** .* ***** * ***** * * 



52 
55 
40 
40 
39 
46 
36 



106 
109 
94 
94 
93 
100 
91 



THIOBLETA 

THIOBLETD 

THIORIZ 

THIOARA 

THIOTABAC2 

THIOTABAC 

THIOCHLA 



DRWGA I KEELTTKVGLHAAQ 127 

DRWGA I K E E LTTKVGLH AAA 13 0 

DKWGARKDDLQNTIVKHVGATAASASA 122 

DKWGAKKDELQSTIAKHL A 114 

DK WGAKKDELQQTI AKH ISST--S-TA 118 

DRWGAKKEELQQTIVKHAAPA- -TVTA 12 6 

DDLVGASQDKLKALVAKHAAA 112 
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SaA 0.25 



ampR 




pTaM 1 338 
4.78 Kb 




cDNA Thio 



Not\ 0.92 



'Amplification d'un tragment de ayu pb 
de la methionine initiatrice au codon stopJ 



A/del 



T 



SamHI 



/Insertion dans le vecteur d'expression pE"f\ 
Ventre les sites Nde\ et SamHI J 



T 



fcoRVO.38 




BamH! 0.51 

cDNA Trx mature 



^Nde\ 0.95 
P<t>l0 Tr^XesfAi 1.00 
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12 3 4 5 6 7 




FIG . 4 



FEUILLE DE REMPLACEMENT (REGIE 26) 
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>be I 235 



pVu II 306 
LcoR I 396 
Sac I 402 
:dl36 I 402 
\sp 718 408 
Cpn i 40£. 



Sma 14 12 
tva 1412 
J(ma 1412 
;<ba I 423 



amHI 417 
spMl 585 
►ml I 709 



CfrlO I 4518 




IIMI 1051 
lot I 1253 
stX I 1 260 
Isc I 1277 
stX I 1280 
Jot 1 1291 

Hind 111 1553 



Xcm I 2481 
Bsg I 2646 



Nco ! 2406 
EcoR V 242 5 



Stu I 2177 
Bsp 120 I 2237 
Apa I 2237 
~Bsm I 2255 
BstB I 2347 



FEU1LLE DE REMPLACEMENT (REGIE 26) 
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SamHI.Xbal.Sst/.Xhol.Pstl.Pvufl.Hindffl 




Bglll 3820 



FJLG - e 
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